优化问题
问题的标准形式p122
minf0(x)
s.t. fi(x)≤0, i=1,..,m
hi(x)=0, i=1,..,p
描述在满足所有条件下的x中寻找极小化f0(x)的问题。
其中x为优化变量,函数f0(x)为目标函数或费用函数,fi(x)≤0为不等式约束,h0(x)=0为等式约束,对目标函数和约束函数都有定义的点为优化问题的定义域。
问题的最优值定义为p∗:
p∗=inf{f0(x)∣fi(x)≤0,hi(x)=0}
当p∗为无穷时,则问题无可行解。
最优点和局部最优点
若x⋆是可行的并且f0(x⋆)=p⋆,则x⋆为最优点,所有最优解的集合为最优集。
若问题不存在最优解,则最优值是不可达的,满足f0(x)≤p⋆+ϵ的可行解为x的ϵ− 次优。
局部最优x定义为:存在R>0,使得:
f0(x)=inf{f0(z)∣fi(z)≤0,hi(z)=0,∣∣z−x∣∣2≤R}
粗略的讲,这意味着x在可行集内的一个点的周围极小化了f0。
等价问题p124
- 可以将最大化问题转化为标准形式(最小化问题)。
- 伸缩变换与原问题是等价的。
- 变量替换是等价的。
- 单调增的复合函数与原问题等价。
- 松弛变量
- fi(x)≤0等价于存在一个si≥0满足fi(x)+si=0。
- 可以将不等式约束替换为一个等式和一个非负约束。
- 消除等式约束p126
- 可以显式的参数化等式约束,来进行变量替换,进而消除等式约束。
- 如hi(x)=0若可以表示为x=ϕ(z),则可以将x带入不等式约束。
- 消除线性等式约束
- 若等式约束是线性的Ax=b,则可以将其表示为x=Fz+x0,将其带入其他约束条件。
- 引入等式约束
- 优化部分变量
- x,yinff(x,y)=xinfyinff(x,y)
- 可优化一部分变量再优化另一部分变量来达到优化函数的目的。
上镜图问题形式
mint
s.t. fo(x)−t≤0
fi(x)≤0, i=1,..,m
hi(x)=0, i=1,..,p
凸优化
标准形式
minf0(t)
s.t. fi(x)≤0, i=1,..,m
aiTx=bi, i=1,..,p
与一般的优化问题对照,其附加要求为:
- 目标函数必须是凸的
- 不等式约束函数必须是凸的
- 等式约束函数aiTx=bi必须是仿射的
我们可以发现,凸优化问题的可行集是凸的,因为它是下水平集、超平面的交集。
重要性质
对于凸优化问题来说,一个基础的性质是p132:
其任意局部最优解也是全局最优解。
但对于拟凸优化问题,这一性质不成立。
可微函数的最优性准则
若目标函数f0是可微的,对于所有x,y∈domf0,都有:
f0(y)≥f0(x)+▽f0(x)T(y−x)
若x是最优解,则当且仅当x属于可行集且:
▽f0(x)T(y−x)≥0
无约束问题p133
对于无约束问题,可以简化为一个简单的最优解充要条件:
▽f0(x)=0
可以通过可微函数的最优性准则
得到。
根据解的数量,有几种情况的可能:
- 如果等式没有解,那么没有最优点,问题无下界或最优值有限但不可达
- 可能有多解,那么这些解都是最优集
只含等式约束的问题p134
minf0(x)
s.t. Ax=b
我们由可微函数的最优性准则
可以得到,对于任意满足Ax=b的y:
▽f0(x)T(y−x)≥0
因此,每个可行解y都可以写成y=x+v的形式,其中v∈N(A)。因此,最优性条件表示为:
▽f0(x)Tv≥0, ∀v∈N(A)
若一个线性函数在子空间中非负,则它在子空间中必恒等为0。因此,▽f0(x)Tv=0,即:
▽f0(x)⊥N(A)
即▽f0(x)∈C(A)T,即存在v∈R,使得:
▽f0(x)+ATv=0
这是经典的lagrange乘子最优性条件。
非负象限中的极小化
minf0(x)
s.t. x⪰0
这里的唯一不等式约束是变量的非负约束。因此,最优化条件变为:
x⪰0, ▽f0(x)(y−x)≥0,∀y⪰0
函数▽f0(x)Ty只有在▽f0(x)T⪰0时才有下界,因此,条件简化为−▽f0(x)Tx≥0。
但是x⪰0且▽f0(x)⪰0,因此必须有▽f0(x)Tx=0,即:
i=1∑n(▽f0(x))ixi=0
因此,最优性条件可以表示为:
x⪰0, ▽⪰0,(▽f0(x))ixi=0
最后一个条件称为互补性,意味着向量x和▽f0(x)的稀疏模式是互补的。
等价的凸问题p136
消除等式约束
- 只需利用标准的线性代数运算,将等式约束转换解出带入,可以保持问题的凸性。
引入等式约束
松弛变量
- 可以将fi(x)≤0 通过松弛变量转化为等式约束fi(x)+si=0,其中fi(x)必须是仿射的。
上镜图问题形式
mint
s.t. fo(x)−t≤0
fi(x)≤0, i=1,..,m
aiTx=bi i=1,..,p
极小化部分变量
拟凸优化
当目标函数是拟凸时,称为拟凸优化问题。
拟凸优化的重要区别是局部最优可能不是全局最优的。
可以使用二分法来解决拟凸优化问题。
线性规划
当目标函数和约束函数都是仿射时,称作LP问题:
min cTx+d
s.t. Gx⪯h
Ax=b
LP问题当然是凸优化问题,并且,其可行集是多面体。
标准形式与不标准形式
在标准形式的线性规划问题中,仅有的不等式约束都是分量的非负约束:
min cTx
s.t. Ax=b
x⪰0
如果没有等式约束,则称为不等式线性规划:
min cTx
s.t. Ax⪯b
可以使用引入松弛变量和变量替换的方法将一般的线性规划转化为标准形式p140。
例子
- 食谱问题
- 多面体的
chebyshev
中心
- 分片线性极小化(Piecewise Linear Minimization )
线性分式规划
min eTx+fcTx+d
s.t. Gx⪯h
Ax=b
其中domf={x∣eTx+f>0}
这个目标函数是拟凸的,因此为拟凸优化问题。
转为线性规划问题
如果可行集非空,则可以转化为等价的LP:
min cTy+dz
s.t. Gy−hz⪯0
Ay−bz=0
eTy+fz=0
z≥0
其中,如果x是可行解,那么y=eTx+fx,z=eTx+f1
二次优化p145
当凸优化问题的目标函数是(凸)二次型且约束函数为仿射时,该问题为二次规划(QP),可以表示为:
min (1/2)xTPx+qTx+r
s.t. Gx⪯h
Ax=b
其中P为半正定对称矩阵。从集合上讲,我们是在多面体上极小化一个凸二次函数。
若在上式中,不等式约束也是(凸)二次型,那么这问题为二次约束二次规划(QCQP),此时是在椭圆的交集构成的可行集上极小化凸二次函数。
例子
最小二乘及回归p146
极小化凸二次函数:
∣∣Ax−b∣∣22=aTATAx−2bTAx+bTb
这个问题很简单,有解析解ATAx=ATb,可见最小二乘法这篇文章。
增加线性不等式约束后的问题为约束回归或约束最小二乘,此问题不再有简单的解析解,例如:
min ∣∣Ax−b∣∣22
s.t. li≤xi≤ui
这是一个二次规划。
二阶锥规划p149
一个与二次规划紧密相关的问题是二阶锥规划(SOCP):
min fTx
s.t. ∣∣Aix+bi∣∣2≤ciTx+di
Fx=g
其中x是优化变量,称∣∣Aix+bi∣∣2≤ciTx+di为二阶锥约束。
鲁棒线性规划
min cTx
s.t. aiTx≤bi,∀ai∈ϵi,i=1,..,m
其中,ai是在变化的,这一鲁棒线性约束可以表示为:
sup{aiTx∣ai∈ϵi}≤bi
而ai的变化可以表示为:
ai∈ϵi={ai^+Piu∣∣∣u∣∣2≤1}
因此,原约束可以表示为:
sup{aiTx∣ai∈ϵi}=ai^Tx+sup{uTPix∣∣∣u∣∣2≤1}=ai^Tx+∣∣PiTx∣∣2
鲁棒性约束可以表示为:
ai^Tx+∣∣PiTx∣∣2≤b
这是一个二阶锥规划,因此,可以将其转化为SOCP:
min cTx
s.t. ai^Tx+∣∣PiTx∣∣2≤b
几何规划
这是一类特殊的优化问题,他们的自然形式并不是凸的,但通过变量替换或目标函数、约束函数的转换,可以将其转换为凸优化问题。
单项式和正项式p153
函数f 定义为:
f(x)=cx1a1x2a2...xnan
其中c>0,被称为单项式函数。
以下函数被称为正项式函数:
f(x)=k=1∑Kckx1a1kx2a2k...xnank
其中ck大于0。
正项式对于加法、数乘和非负的伸缩变化是封闭的。
单项式对于数乘和除是封闭的。
几何规划
具有以下形式的优化问题被称为几何规划(GP):
min f0(x)
s.t. fi(x)≤1,i=1,...,m
hi(x)=1,i=1,...,p
凸形式的几何规划
几何规划一般不是凸优化问题,但我们可以将其转换为凸优化。
用yi=logxi定义变量,因此xi=eyi。如果f是x的单项式函数,即:f(x)=cx1a1x2a2...xnan,则:
f(x)=f(ey1,...,eyn)=eaTy+b
其中b=logc,变量替换将一个单项式函数转化为以仿射函数为指数的函数。
类似,若f是正项式,则可以转化为:
f(x)=k=1∑KeakTy+bk
经过变换,正项式转换为以仿射函数为指数的函数的和。
因此,集合规划可以用新变量y的形式表示:
mink=1∑KeakTy+bk
s.t. k=1∑KieaikTy+bik
egiTy+hi=1
如果正则式目标函数和所有约束函数都只含一项,即都是单项式,那么凸形式的集合规划将退化为一般的线性规划。